检索结果

Select

1. 基于帧间跨越光流的视频超分辨率重建网络

刘扬, 刘蓉, 方可, 张心月, 王光旭

《计算机应用》唯一官方网站 2024, 44 (4): 1277-1284. DOI: 10.11772/j.issn.1001-9081.2023040523

摘要（104）

HTML （0）

PDF （3588KB）（53）

面对运动幅度较大的复杂场景，当前的视频超分辨率（VSR）算法在处理长序列时无法充分利用不同距离的帧间信息，难以精确地恢复遮挡、边界和多细节区域。为解决上述问题，提出一种基于帧间跨越光流机制的VSR模型。首先，通过密集残差块（RDB）提取低分辨率视频帧（LR）的浅层特征；其次，通过光流空间金字塔网络（SPyNet）以不同时间长度的跨越光流对视频帧进行运动估计和运动补偿，并通过RDB对帧间信息进行深层特征提取与矫正；最后，融合浅层特征与深层特征，并通过上采样得到高分辨率视频帧（HR）。在REDS4公开数据集上的实验结果表明，所提模型与经典的非显式运动补偿的动态上采样滤波器视频超分辨率网络（DUF-VSR）相比，峰值信噪比（PSNR）和结构相似性（SSIM）分别提升了1.07 dB和0.06。验证了所提模型可有效提高视频图像重建的质量。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 融合提示知识的方面级情感分析方法

张心月, 刘蓉, 魏驰宇, 方可

《计算机应用》唯一官方网站 2023, 43 (9): 2753-2759. DOI: 10.11772/j.issn.1001-9081.2022091347

摘要（398）

HTML （18）

PDF （1699KB）（209）

针对基于预训练模型的方面级情感分析普遍使用端到端框架，存在上下游阶段任务不一致、难以有效建模方面词和上下文之间关系的问题，提出一种融合提示知识的方面级情感分析方法。首先基于Prompt机制构造提示文本，将该提示文本与原始句子和方面词进行拼接，并把得到的结果作为预训练模型BERT（Bidirectional Encoder Representation from Transformers）的输入，以有效捕获方面词和上下文之间的语义联系，同时提升模型对情感分析任务的感知能力；然后构建情感标签词表，并将它融入情感标签词映射层，以减小模型的搜索空间，使预训练模型获取标签词表中丰富的语义知识，并增强模型的学习能力。实验结果表明，所提方法在SemEval2014 Task4数据集的Restaurant、Laptop两个领域数据集和ChnSentiCorp数据集上的F1值分别达到了77.42%、75.20%、94.89%，与Glove-TextCNN、P-tuning等主流方面级情感分析方法相比提高了0.65~10.71、1.02~9.58与0.83~6.40个百分点，验证了所提方法对方面级情感分析的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 复杂场景下的行人跌倒检测算法

方可, 刘蓉, 魏驰宇, 张心月, 刘杨

《计算机应用》唯一官方网站 2023, 43 (6): 1811-1817. DOI: 10.11772/j.issn.1001-9081.2022050754

摘要（273）

HTML （17）

PDF （2529KB）（164）

随着人口老龄化程度的不断深化，跌倒检测成为医疗与健康领域的一个关键问题。针对复杂场景下跌倒检测算法准确率偏低的问题，提出一种改进的跌倒检测模型——PDD-FCOS（PVT DRFPN DIoU-Fully Convolutional One-Stage object detection）。在基准FCOS算法的骨干网络中引入金字塔视觉转换器（PVT），以不增加计算量为前提提取更丰富的语义信息；在特征信息融合阶段插入双重细化特征金字塔网络（DRFPN），更加准确地学习特征图之间采样点的位置和其他信息，并通过上下文信息捕获特征通道之间更准确的语义关系，从而提升检测性能；训练阶段采用距离交并比（DIoU）损失进行边界框回归，通过优化预测框与目标框中心点的距离，使回归框收敛得更快更准确，从而有效提高跌倒检测算法的准确率。实验结果表明，所提模型在开源数据集Fall detection Database上平均精确度均值（mAP）达到82.2%，与基准FCOS算法相比，所提算法的mAP提升了6.4个百分点，且相较于其他主流目标检测算法有精度上的提升以及更好的泛化能力。

图表 | 参考文献 | 相关文章 | 多维度评价